首页> 外文OA文献 >Hypergraph partitioning based models and methods for exploiting cache locality in sparse matrix-vector multiplication
【2h】

Hypergraph partitioning based models and methods for exploiting cache locality in sparse matrix-vector multiplication

机译:基于超图分区的稀疏矩阵矢量乘法中利用缓存局部性的模型和方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Sparse matrix-vector multiplication (SpMxV) is a kernel operation widely used in iterative linear solvers. The same sparse matrix is multiplied by a dense vector repeatedly in these solvers. Matrices with irregular sparsity patterns make it difficult to utilize cache locality effectively in SpMxV computations. In this work, we investigate single-and multiple-SpMxV frameworks for exploiting cache locality in SpMxV computations. For the single-SpMxV framework, we propose two cache-size-aware row/column reordering methods based on one-dimensional (1D) and twodimensional (2D) top-down sparse matrix partitioning. We utilize the column-net hypergraph model for the 1D method and enhance the row-column-net hypergraph model for the 2D method. The primary aim in both of the proposed methods is to maximize the exploitation of temporal locality in accessing input vector entries. The multiple-SpMxV framework depends on splitting a given matrix into a sum of multiple nonzero-disjoint matrices. We propose a cache-size-aware splitting method based on 2D top-down sparse matrix partitioning by utilizing the row-column-net hypergraph model. The aim in this proposed method is to maximize the exploitation of temporal locality in accessing both input-and output-vector entries. We evaluate the validity of our models and methods on a wide range of sparse matrices using both cache-miss simulations and actual runs by using OSKI. Experimental results show that proposed methods and models outperform state-of-the-art schemes. © 2013 Society for Industrial and Applied Mathematics.
机译:稀疏矩阵向量乘法(SpMxV)是在迭代线性求解器中广泛使用的内核操作。在这些求解器中,将相同的稀疏矩阵重复乘以一个密集向量。具有稀疏稀疏模式的矩阵使得难以在SpMxV计算中有效利用缓存局部性。在这项工作中,我们研究单一和多个SpMxV框架,以利用SpMxV计算中的缓存局部性。对于单SpMxV框架,我们提出了两种基于一维(1D)和二维(2D)自上而下的稀疏矩阵分区的可感知缓存大小的行/列重新排序方法。我们将列网超图模型用于一维方法,并将行列网超图模型用于二维方法。两种提出的方​​法的主要目的是在访问输入向量条目时最大化对时间局部性的利用。 Multiple-SpMxV框架取决于将给定的矩阵拆分为多个非零不相交矩阵的总和。我们利用行-列-网超图模型,提出了一种基于二维自上而下稀疏矩阵划分的缓存大小感知分割方法。该提出的方法的目的是在访问输入和输出矢量条目时最大程度地利用时间局部性。我们通过使用OSKI在缓存稀疏模拟和实际运行中评估了各种稀疏矩阵上的模型和方法的有效性。实验结果表明,所提出的方法和模型优于最新的方案。 ©2013工业和应用数学学会。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号